Este relatório fornece uma análise visual e estatística detalhada de um determinado conjunto de dados, usando várias técnicas como mapas de calor de correlação, histogramas, gráficos de dispersão e regressões lineares.
Este mapa de calor mostra a correlação entre colunas numéricas no conjunto de dados. Um valor próximo de 1 indica uma forte correlação positiva, enquanto um valor próximo de -1 indica uma forte correlação negativa. Um valor próximo de 0 significa que não há correlação.
A tabela abaixo resume as estatísticas básicas para cada coluna numérica, incluindo a contagem, média, desvio padrão e os valores mínimo e máximo.
| Column | Count | Mean | Std | Min | 25% | 50% | 75% | Max |
|---|---|---|---|---|---|---|---|---|
| Tamanho | 4000.0 | -0.50301462982675 | 1.928058688854979 | -7.151703059 | -1.816764527 | -0.5137025125000001 | 0.8055264495000001 | 6.406366899 |
| Peso | 4000.0 | -0.9895465445945 | 1.6025072141517547 | -7.149847675 | -2.01177029275 | -0.9847364865 | 0.03097644 | 5.79071359 |
| Doçura | 4000.0 | -0.47047851978824995 | 1.943440658920452 | -6.894485494 | -1.7384250625 | -0.5047584635 | 0.8019219209999999 | 6.374915513 |
| Crocância | 4000.0 | 0.9854779038585 | 1.402757204211963 | -6.055057805 | 0.06276439525000001 | 0.9982494390000001 | 1.8942342170000002 | 7.619851801 |
| Suculência | 4000.0 | 0.5121179684932501 | 1.9302856730942946 | -5.961897048 | -0.80128581525 | 0.5342186584999999 | 1.8359763875 | 7.364402864 |
| Maturação | 4000.0 | 0.4982774280305 | 1.8744267757033417 | -5.864598918 | -0.7716768665 | 0.5034447135 | 1.76621164075 | 7.237836684 |
| Acidez | 4000.0 | 0.07687729571600001 | 2.110269636420919 | -7.010538475 | -1.3774240784999998 | 0.022608968 | 1.510492756 | 7.404736238 |
Abaixo estão as estatísticas descritivas para cada coluna do conjunto de dados, incluindo média, mediana, desvio padrão e quartis.
Os histogramas abaixo mostram a distribuição de valores para cada coluna numérica no conjunto de dados.
Os gráficos de dispersão mostram a relação entre duas variáveis numéricas. Um padrão pode ajudar a identificar correlações, tendências ou valores discrepantes.
A regressão linear tenta modelar a relação entre duas variáveis numéricas ajustando uma linha através dos pontos de dados. A linha vermelha nos gráficos representa o ajuste linear.